技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
3
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
3
篇
[DAY 3] YOLOv2
15th鐵人賽
Xian
2023-09-18 16:00:22
488 瀏覽
分享至
YOLO9000: Better, Faster, Stronger
Joseph Redmon, Ali Farhadi
可偵測超過9000種類別
問題
過去方法只能辨識很少的類別物件。
替影像作detection標註比做classification標註更耗時。
跟Region proposal based的方法相比,YOLOv1 recall較低。
要提升準確度往往需要提高網路複雜度。
方法:
Better
Batch Normalization
: 取代Dropout,加快收斂且
提升2% mAP
。
High Resolution Classifier
: 先用448×448像素值的影像預先進行訓練10個epochs,先
提升4% mAP
。
Anchor Boxes
:
移除全連結層,並用Anchor Boxes預測Bounding Boxes。
輸入為416×416為了讓特徵圖中的座標為奇數個,這樣中心點座標就會唯一。mAP會下降,但是提升了Recall。
Dimension Clusters
:過去需手動設定Anchor Box數量以及尺寸,但本文利用K-means去生成Bounding Box,可以使得模型學得更好。
K-mean用:
最終求得:
K=5
,Recall跟模型複雜度較為適合。
Direct location prediction
: 每個Grid Cell預測五個Bounding Box,
並且有五個值
bx,by:預測的Bounding Box中心點位置+距離最左邊跟最上面Grid Cell的格數。
bw,bh:預測的Bounding Box寬跟高乘上寬跟高篇移量的exponential結果。
信心度值會再經過sigmoid後輸出
Fine-Grained Features
:串接較為淺層的特徵到深層網路當中,提升1%。
Multi-Scale Training
:為了讓模型可以處理不同大小的影像,每10個batch會重新選擇一個新的影像大小{320,352, ...,608}
Faster
物件偵測網路常採用VGG-16用於特徵提取,但是因為VGG-16參數量太大,YOLOv2提出一個新的分類模型: Darknet-19。
Darknet-19
: 19個convolution layers,5個max pooling layers,參數量少很多。
Stronger
當將兩個Dataset進行合併的時候可能會遇到類別互斥問題,舉論文例子:對於一張狗的影像,有的資料集標得是"狗",有的資料集標的是狗的品種。
建立
Hierarchical Wordtree
:
可藉由路徑上的節點機率來得到對應類別的機率,其中phisical object代表影像中是否有物件存在。
模型訓練
Classification:會先用分類網路預訓練10個epochs訓練448×448的影像,並接續訓練160個epochs。
Detection: 移除上面預訓練好的classification模型最後一層convolution層,並添加三層3×3×1024的卷積層,以及最後加入一層輸出層(1×1×(5 boxes × (5 coordinates +類別數))),中間有加入passthorough層。
實驗結果
文章使用之圖片擷取自該篇論文
留言
追蹤
檢舉
上一篇
[DAY 2] YOLO的開端-YOLOv1
下一篇
[DAY 4] YOLOv3
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
8
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22208
篇
完賽人數
600
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
安卓電視盒
虛擬機點啟動 卻出現錯誤
PDF影像資料不足
安裝DRIVER一問
win10系統,一個資料夾無法刪除(因裡面有太多層子資料夾),求刪除的解法
防火牆阻擋無法打開某些網頁的問題
請問大家都是如何進行部屬前的程式測試
商品計價公式
關於pychram 安裝新的anaconda後設定完全亂掉了.求前輩們幫忙查看哪裡設定出錯了.
開啟wifi後在輸入帳密視窗卡住
熱門回答
商品計價公式
PDF影像資料不足
關於pychram 安裝新的anaconda後設定完全亂掉了.求前輩們幫忙查看哪裡設定出錯了.
防火牆阻擋無法打開某些網頁的問題
虛擬機點啟動 卻出現錯誤
熱門文章
使用LINE發報機房溫度/濕度 過高通知
每日一篇學習筆記 直到我做完專題 :( [Day41]
每日一篇學習筆記 直到我做完專題 :( [Day42]
探索容器資源限制:透過實驗理解 Docker 的 CPU 和記憶體調度 (2)
體驗SQL資料庫Day2:常用資料型態解析和資料操作
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}